Meta没做的,英伟达做了!全新架构吞吐量狂飙6倍,20万亿Token训练 Meta没做的,英伟达做了!全新架构吞吐量狂飙6倍,20万亿Token训练 关键词: AI新闻,NVIDIA Nemotron Nano 2,英伟达模型,小模型 英伟达发布全新架构9B模型,以Mamba-Transformer混合架构实现推理吞吐量最高提升6倍,对标Qwen3-8B并在数学、代码、推理与长上下文任务中表现持平或更优。 来自主题: AI资讯 6128 点击 2025-08-19 11:35